本文研究了如何在推理时利用额外计算资源来提高大型语言模型(LLM)的性能,并通过实验验证了这种方法的有效性。具体来说,作者提出了一个自适应的“最优计算”策略,可以根据问题难度动态地选择不同的测试时间计算方法,从而...
浏览 80 次 标签: 【Open AI o1 实现原理】在推理测试时优化LLM的计算比扩大模型参数更有效 Scaling LLM Test-Time Compute